查看原文
其他

资源宝库|以Sketch Engine为船遨游语料海洋(一)

张一孟 翻译圈
2024-09-09

‍‍‍‍‍‍‍‍‍‍‍

Sketch Engine是一款基于云计算的强大的语言学习和文本分析工具,专为语言学家、语料库语言学家、译者和语言学习者而设计。其目标在于帮助用户轻松检索大量文本,并通过先进的语料库技术提取所需信息。官网地址https://www.sketchengine.eu/

作为如此一个得力的语言学习和语料处理助手,我们怎么能不了解一下呢!接下来,跟着小编一起小学习一下几个它的主要功能吧!

01  单词画像|Word Sketch

单词画像是从成千上万的使用实例中收集信息,提供相应的单词分类搭配,并附有实例链接。这一功能可以为用户提供非常详细的语境来展示某一词的使用和搭配,并且会附上它的出处。

具体操作:首先,我们要在图上红框中选择适合的语料库(本文以BNC语料库为例),之后在蓝框输入想要搜索的单词(如:environment),然后GO!就会出现搜索结果。

注意:所有搜索输入的必须是lemma(词目)。

图片展示了部分汇总。可以看到,从左到右5栏分别汇总了与environment搭配的修饰词(computing等),以environment修饰的名词和动词(circular等),以environment为宾语的动词(protect等),以environment为主语的动词(influence等),environment后连接频率较高的词(development)。

02单词画像差异|Word Sketch Difference

单词画像差异是单词画像功能的扩展。它能为两个单词生成单词画像,并对它们进行比较,从而轻而易举地观察使用中的差异。也就是说,单词画像是从语料库中提取单词搭配及使用的情况,而单词画像差异则是对比两个词义相近的词的搭配使用,并呈现对比结果。

具体操作:在图上红框里输入你想对比的两个单词,继续GO就可以看到结果啦!

上图展示了部分汇总。绿色代表与great有关的项,红色代表与best有关的项。可以看出,上图三栏中,从左到右对比了greatbest连接的词(small/coach等),以greatbest为宾语的词(peter/set等),以及以greatbest为宾语的词(thank/fall等)。而且,该功能以颜色差异表示频率。如上图,越靠近蓝色,与great搭配频率越高;越靠近红色,则与best搭配频繁更高。

03 同义词库|THESAURUS

Sketch Engine中的同义词库是通过分析数十亿文本语料库的巧妙算法自动生成的。这意味着,在语料库足够大的前提下,可以为语料中的几乎任何单词生成同义词库。

具体操作:同样在图上红框里输入你想查找的单词,然后GO就出结果啦!

这里以单词“gain”为例搜索,可以发现很多与“gain”相关的词语。但是相信你也发现了,图上并不是所有词都是“gain”的同义词,例如图中的“lose”。所以要提醒大家,这里的同义词并不是狭义上的同义词(近义词),而是意义相似的词以及可能出现在相似语境下的词。

举个例子,狭义上的同义词,也就是近义词,可以是significantimportant;而这里的同义词可能是指teacoffee

本期小编介绍了Sketch Engine主要功能的其中三个,其余主要功能介绍请关注我们的后续更新噢!

想要了解更多的话请大家移步官方教程网址,文末已附上供大家参考学习:
https://www.sketchengine.eu/quick-start-guide/choose-corpus-lesson/

特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

- END -



翻译圈公众号旨在为读者提供名师和专家对口笔译的真知灼见,CATTI考试和MTI入学考试信息,翻译等语言服务就业资讯,以及口笔译学习资源和知识,希望在翻译之路上,为大家助上一臂之力。欢迎大家积极留言,为我们提供建设性意见,我们共同进步!


原文作者:张一孟

     ‍‍‍‍‍‍‍‍
推文编辑:侯亦君‍‍‍
指导老师:董妙子

审核:吕欣潼、吴志雄

项目统筹:吕欣潼

资讯推荐


AIGC时代的翻译技术沙龙‍‍‍‍


▶精品课程

精品课程|ChatGPT与语料数据处理工作坊

精品课程|刘世界:6节语料库专题课,从入门到精通

精品课程|倒计时5天!实习证明、翻译项目,尽在四周暑期口笔译实习实践竞赛营!

精品课程|ChatGPT提示工程(Prompt Eng.)实践工作坊

精品课程|2023年暑期翻译技术实战研修班重磅来袭

精品课程|ChatGPT辅助翻译质量评估沙龙

▶资源宝库

资源宝库|小鹤音形输入法——打字,你还能更快!

资源宝库|一篇文章教你建立自己的语料库

资源宝库|双拼输入法——两天时间让你成为打字高手

▶翻译百科

翻译百科|《中国大百科全书》中的“可比语料库”

翻译百科|《中国大百科全书》中的“翻译政策”

翻译百科|《中国大百科全书》中的“语料库语言学”

翻译百科|《中国大百科全书》中的“法律翻译”

翻译百科|《中国大百科全书》中的“语料库模式分析”

翻译百科|《中国大百科全书》中的“自适应机器翻译”

翻译百科|《中国大百科全书》中的“翻译批评”

翻译百科|《中国大百科全书》中的“翻译规范”

翻译百科|《中国大百科全书》中的“翻译思维”

翻译百科|《中国大百科全书》中的“翻译对等”

▶译界动态

译界动态|首届全国翻译技术大赛决赛成绩公布

译界动态|2023中国高校翻译专业排名

译界动态|关于天津外国语大学高级翻译学院师生使用ChatGPT等AIGC技术工具情况的调研报告

译界动态|李长栓:用ChatGPT解决英译汉中的理解问题

译界动态|从书面到口头:AI口译的挑战与可能性

译界动态|2023年人工智能的一些顶级趋势

  关注我们 了解更多

CATTI和MTI资讯

语言服务就业信息

翻译名师真知灼见

翻译学习精品课程


继续滑动看下一个
翻译圈
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存